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融 媒 体 时 代 人 工 智 能 技术 在 播音 主持 工作 的 应 用 


(苍南 县 融 媒 体 中 心 ， 浙 江 温州 325800 ) 


摘 要 : 由 于 人 工 智 能 技术 的 应 用 对 传统 播音 主持 工作 方式 创新 和 改革 具有 重要 作用 ， 为 此 提出 融 媒 体 时 代 人 工 智 能 技术 在 
播音 主持 工作 的 应 用 研究 。 在 融 媒 体 时 代 下 ， 人 工 智能 技术 在 播音 主持 工作 中 的 应 用 ， 具 有 播报 信息 标准 、 表 达 形 式 新 络 、 
学 习 能 力 较 强 、 节 约 人 力 成 本 等 应 用 优势 。 利 用 人 工 智能 技术 采集 、 处 理 、 分 析 语 音 数据 信号 ， 通 过 语音 合成 技术 模拟 出 人 


202310.01240v1 


chinaXiv 


的 声音 ， 完 成 播报 语音 工作 ; 经 过 语音 数据 采集 、 数 据 处 理 、 数 据 分 析 、 主 题 提 炼 、 模 板 匹 配 等 一 系列 流程 ， 实 现 播 报 内 容 
的 自动 化 生成 ; 利用 人 工 智能 交互 技术 开发 虚拟 主持 人 ， 使 其 具备 交流 、 对 话 功能 ， 完 成 播音 主持 的 知识 问答 工作 ， 以 此 完 


成 融 媒 体 时 代 人 工 智 能 技术 在 播音 主持 工作 的 应 用 研究 。 
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导语 

人 工 智能 技术 ( Artificial Intelligence Technology， 简 
称 为 AL) 也 被 称 为 机 器 智能 技术 、 智 械 技术 ， 是 指 通 
过 计算 机 程序 来 呈现 人 类 智能 的 技术 ， 约 其， 麦卡锡 于 
1964 年 发 表 的 智能 主题 报刊 中 , 将 人 工 智能 技术 定义 为 : 
可 以 学 习 周 围 知 识 并 做 出 行为 以 致 达到 目标 的 技术 。 人 
工 智能 技术 作为 计算 机 学 科 的 一 个 重要 分 支 ， 可 以 利用 
计算 机 程序 模拟 出 人 类 的 思维 过 程 和 行为 ， 由 于 其 能 具 
有 决策 精准 、 具 有 较 强 的 学 习 能 力 ， 得 到 了 愈加 广泛 的 
重视 ， 并 且 成 为 研究 领域 比较 热门 的 话题 。 

目前 人 工 智能 技术 已 经 被 广泛 应 用 到 多 个 领域 当中 ， 
比如 机 器 人 、 智 能 决策 、 仿 真 、 控 制 系统 、 识 别 系统 等 。 
在 融 媒 体 时 代 下 ， 人 工 智能 技术 也 逐渐 被 应 用 到 播音 主持 
工作 中 , 在 传统 的 播音 主持 工作 方式 当中 融合 人 工 智能 技 
术 ， 可 以 加 快 播音 主持 行业 的 转型 ， 提 高 播音 主持 工作 的 
智能 化 、 信 息 化 、 数 据 化 水 平 。 在 融 媒 体 时 代 背 景 下 ， 
需要 对 播音 主持 工作 的 形式 进行 重新 定义 ， 用 人 工 智 能 
代 传统 播音 主持 从 书面 文字 到 口语 表述 这 一 过 程 ， 使 播音 
主持 工作 变 得 更 加 新 颖 ， 同 时 也 减少 了 播音 主持 的 人 力 资 
源 成 本 。 在 新 闻 媒 体 的 传播 领域 当中 应 用 人 工 智能 技术 的 
时 间 比 较 短暂 ， 其 只 是 作为 一 种 新 的 播音 主持 技术 手段 ， 
学 术 界 对 其 所 做 的 研究 还 不 够 深入 ， 为 此 提出 融 媒 体 时 代 
人 工 智能 技术 在 播音 主持 工作 的 应 用 。 
1. 融 媒 体 时 代 人 工 智能 技术 在 播音 主持 工作 的 应 用 优势 
1.1 播报 信息 标准 

对 于 传播 学 而 言 ， 播 音 主持 是 通过 媒介 实现 的 信息 


传播 ， 当 播音 主持 人 阅览 到 当天 的 播音 发 言 稿 之 后 ， 要 
求 要 将 其 准确 、 流 畅 地 播报 ， 在 这 一 过 程 中 播音 主持 人 
难免 会 发 生 一 些 意外 ， 出 现 错 报 、 发 音 不 准 等 问题 。 

在 融 媒体 时 代 下 ， 利 用 人 工 智 能 技术 ， 对 信息 进行 
精准 的 处 理 ， 最 终生 成 语音 ， 实 现 对 播音 发 言 稿件 准确 
的 播报 。” 人 工 智 能 技术 精度 较 高 ， 声 音 的 大 小 、 速 度 、 
音色 都 是 事先 在 计算 机 程序 上 设 定 的 ， 并 且 人 工 智能 合 
成 的 语音 具有 一 个 语音 技术 原型 ， 也 就 是 样本 。 人 工 智 
能 合成 语音 在 词汇 表达 和 语法 结构 上 都 非常 规范 ， 吐 字 
清晰 ， 表 达 流 畅 ， 因 此 人 工 智能 技术 在 播音 主持 工作 的 
应 用 ， 具 有 播报 信息 标准 的 应 用 优势 。 

1.2 表达 形式 新 颖 

利用 人 工 智 能 技术 开发 的 虚拟 人 物 已 经 被 广泛 应 用 
在 播音 主持 工作 中 ， 虚 拟人 物 具备 真实 人 物 的 所 有 主持 
功能 ， 具 有 真实 人 物 的 表情 、 眼 神 以 及 动作 。 此 外 它 还 
能 自由 变换 男 、 女 生 声 音 ， 它 的 外 观 可 以 是 人 ， 也 可 以 
设计 成 卡通 人 物 ， 它 的 出 现 和 应 用 给 播音 主持 工作 带 来 
了 新 鲜 感 ， 可 以 时 刻 抓 住 观众 好 奇 的 心理 ， 因 此 人 工 智 
能 技术 在 播音 主持 工作 的 应 用 ， 具 有 表达 形式 新 颖 的 优 
势 。 

1.3 学习 能 力 较 强 

人 工 智 能 具有 超 强 的 学 习 能 力 ， 它 的 本 质 是 含有 多 
隐 层 的 智能 学 习 模型 ， 通 过 对 海量 的 数据 训练 、 学 习 ， 
得 到 具有 代表 性 的 特征 信息 , 最 终 达 到 特征 学 习 的 目的 。 
利用 人 工 智 能 这 一 特点 ， 完 成 播音 主持 的 情感 问答 、 知 
识 解 答 等 工作 。 以 “微软 小 水 ”人工 智能 机 器 人 为 例 ， 
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当 用 户 向 其 发 出 提问 之 后 ，“ 微 软 小 六” 能 够 快速 地 查 
阅 到 作答 语 料 基 础 ， 进 而 回答 问题 。 这 一 过 程 是 持续 不 
断 的 ， 人 工 智 能 机 器 人 根据 采集 到 的 数据 不 断 地 训练 ， 
逐渐 深入 学 习 ， 做 到 精准 、 快 速 地 回答 观众 的 问题 。 
1.4 节约 人 力 成 本 

在 播音 主持 实际 工作 环节 中 ， 需 要 消耗 大 量 的 人 
力 资源 ， 首 先 需 要 编导 撰写 播音 稿 ， 再 由 播音 主持 人 
完成 新 闻 的 口 播 ， 如 果 不 是 直播 ， 还 需要 后 期 对 其 进 
行 配音 。 整 个 过 程 不 仅 工 作 效率 较 低 ， 而 且 还 会 消耗 
大 量 的 传播 主体 ， 也 就 是 播音 主持 工作 人 员 的 精 。 而 
从 效益 的 角度 来 说 ， 实 际 上 这 也 是 人 力 成 本 的 消耗 。 局 
如 果 应 用 人 工 智 能 技术 ， 所 有 的 播音 主持 工作 基本 可 
以 由 人 工 智能 来 完成 ， 可 以 极 大 地 节约 人 力 成 本 ， 所 
以 融 媒 体 时 代 下 ， 人 工 智 能 技术 在 播音 主持 工作 的 应 
用 具有 良好 的 优势 。 
2. 融 媒 体 时 代 人 工 智 能 技术 在 播音 主持 工作 的 应 用 

从 上 文 对 人 工 智能 技术 在 播音 主持 工作 的 应 用 优势 
方面 的 分 析 可 知 ， 在 融 媒 体 时 代 下 必须 对 播音 主持 工作 
进行 创新 和 改革 ， 融 人像 人 工 智能 这 样 新 的 网 络 技术 ， 
利用 人 工 智 能 技术 设计 开发 出 虚拟 主持 人 ， 使 其 具备 语 
音 播 报 、 内 容 生 成 、 人 机 交互 等 功能 ， 由 虚拟 主持 人 完 
成 播音 主持 工作 ， 以 下 将 对 融 媒体 时 代 人 工 智能 技术 在 
播音 主持 工作 的 应 用 进行 详细 分 析 。 
2.1 人 工 智 能 技术 在 语音 播报 工作 中 的 应 用 

人 工 智能 技术 在 语音 播报 工作 中 的 应 用 过 程 大 致 可 
分 为 三 个 过 程 , 其 中 包括 前 端 接收 、 中 间 处 理 、 终 端 和 输出 。 
首先 利用 人 工 智能 技术 中 的 声学 前 端 技术 ， 对 人 类 的 语 
音信 号 或 者 是 文本 信号 进行 接收 ， 也 就 是 获取 到 学 习 样 
本 的 语音 数据 。 为 了 获取 高 质量 的 语音 信号 ， 需 要 对 
声 源 发 出 的 声音 进行 定向 拾 音 处 理 和 降 噪 处理， 这样 可 
以 使 人 工 智能 设备 更 好 、 更 容易 地 分 辨 语音 信号 。 接 收 
到 语音 信号 之 后 ， 虽 然 前 面 已 经 对 语音 信号 做 了 简单 地 
处 理 ， 但 是 还 会 存在 一 些 无 效 的 、 无 用 的 ( 不 是 声 源 发 
出 的 语音 信号 ) 、 格 式 缺 失 的 语音 信号 ， 这 些 语音 数据 
的 存在 会 影响 到 语音 播报 的 工作 质量 ， 所 以 需要 将 格式 
缺失 的 信号 剔除 掉 ， 在 此 基础 上 利用 人 工 智 能 识别 技术 
准确 地 识别 到 人 的 声音 , 排除 掉 无 用 和 无 效 的 语音 信号 。 

就 目前 人 工 智 能 识别 技术 水 平 ， 可 以 对 普通 话 、 英 
语 口 语 以 及 其 他 外 语 口语 同时 进行 准确 识别 。 识 别 过 程 
如 下 : 将 竺 识别 的 语音 信号 数据 进行 分 解 ， 分 解 的 目的 
是 提取 语音 信号 关键 特征 ， 以 提取 到 的 特征 为 依据 ， 对 
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海量 的 语音 信号 反复 训练 ， 在 不 断 地 训练 中 识别 到 与 特 
征 不 符 的 数据 信和 号， 将 其 删除 。 最 后 将 处 理 后 的 所 有 数 
据 存 人 到 数据 库 中 ， 将 事先 编辑 好 的 播音 发 言 稿 输入 到 
前 端 , 根据 输入 的 文字 自动 搜索 到 事先 存 好 的 语音 数据 ， 
利用 人 工 智能 语音 合成 技术 将 所 有 单个 的 文字 组 合 到 一 
起 ,最 终 由 终端 输出 语音 ， 以 此 完成 语音 播报 。" 这 一 
过 程 中 应 用 带 来 多 个 人 工 智能 技术 ， 包 括 语音 识别 、 语 
音 理解 、 语 音 分 析 、 语音 合成 等 , 利用 人 工 智能 技术 播报 ， 
可 以 对 播报 的 声音 进行 设计 ， 比 如 林志玲 、 康 辉 等 人 的 
声音 ， 并 且 还 可 以 根据 语音 播报 需求 ， 调 节 语 音 播报 的 
语 速 和 语调 等 。 

目前 使 用 人 工 智能 技术 进行 语音 播报 的 实际 案例 有 
许多 ， 比 如 中 央 电 视 台 以 主持 人 康辉 为 原型 设计 的 虚拟 
语音 播报 虚拟 主持 人 “ 康 小 逻 ”， 其 已 经 被 成 功 应 用 到 
多 个 语音 播报 工作 中 ,包括 天 气 预报 的 语音 播报 、 路 况 
言 息 的 语音 播报 等 。 
2.2 人 工 智 能 技术 在 播音 内 容 生成 中 的 应 用 

人 工 智能 技术 不 仅 能 够 完成 播音 主持 工作 中 的 语音 
播报 ， 还 能 够 撰写 播音 内 容 。 人 工 智能 技术 撰写 播音 内 
容 需 要 经 过 数据 采集 、 数 据 处 理 、 数 据 分 析 、 主 题 提炼 、 
模板 匹配 等 一 系列 流程 ， 首 先 根据 播音 内 容 撰写 要 求 ， 
通过 在 前 端 设 置 “ 关 键 词 ”检索 ， 采 集 到 互联 网 上 与 其 
相符 的 新 闻 稿件 ; 然后 对 采集 到 的 数据 格式 进行 清洗 ， 
即 统一 整理 为 相同 的 数据 格式 ， 利 用 人 工 智能 技术 对 数 
据 进行 分 析 ， 提 取 到 相关 的 观点 ; 最 后 将 提取 到 的 观点 
自动 与 模板 匹配 ,由 终端 输出 ， 从 而 自动 生成 一 个 新 的 、 
符合 要 求 的 播音 稿 。" 应 用 人 工 智 能 技术 编写 新 闻 稿 件 ， 
不 仅 效 率 高 ， 而 且 撰 写 的 内 容 基 本 可 以 满足 撰写 要 求 ， 
目前 辽宁 抚顺 广播 电视 台 已 经 引入 该 项 技术 ， 部 分 新 闻 
稿件 均 有 人 工 智 能 写作 机 器 人 完成 写作 ， 此 外 播音 主持 
工作 中 的 语音 转换 也 是 由 人 工 智 能 技术 自动 化 生产 ， 将 
需要 转换 的 音频 数据 上 传 到 智能 客户 端 , 通过 端点 检测 、 
音频 分 段 、 语 义 分 析 等 技术 将 接收 到 的 音频 数据 快速 地 
转化 为 文本 。™ 但 利用 人 工 智能 技术 撰写 的 播音 内 容 缺 
乏 局 限 性 ,撰写 的 播音 内 容 可 能 会 存在 语义 上 的 错误 ， 
所 以 人 工 智能 机 器 人 撰写 的 播音 内 容 需 要 人 工 进 行 检查 
和 修改 ， 并 且 要 求 比较 高 的 、 难 度 比较 大 的 播音 稿件 由 
人 工 握 写 质量 更 高 ， 因 为 人 工 智能 机 器 人 的 编写 能 力 较 
一 般 。 
2.3 人工 智能 技术 在 知识 解答 中 的 应 用 

知识 解答 也 是 播音 主持 工作 的 一 项 重要 内 容 ， 在 融 
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媒体 时 代 下 ,将 人 工 智 能 技术 与 播音 主持 相 融 合 ， 也 可 
以 实现 人 工 智能 知识 解答 。™ 在 人 工 智能 机 器 人 客户 端 
系统 中 设计 一 个 智能 对 话 模块 ， 该 模块 根据 观众 提出 的 
问题 ， 对 数据 库 中 的 数据 进行 智能 搜索 ， 该 数据 库 不 仅 
要 包含 语音 数据 ， 还 要 包括 图 像 、 手 势 以 及 面部 表情 等 
数据 信息 ， 因 为 人 工 智能 机 器 人 不 仅 要 提取 到 观众 问题 
中 的 关键 词 ， 还 要 对 观众 提问 时 的 胶体 动作 、 面 部 表情 
以 及 手势 进行 提取 ， 综 合 所 有 信息 自动 检索 出 最 终 的 答 
案 ， 通 过 语音 合成 回答 观众 的 问题 。 人 工 智能 机 器 人 不 
仅 可 以 回答 观众 的 问题 , 还 可 以 实现 与 观众 的 对 话 交流 ， 
具备 多 种 社交 功能 。"" 目前 在 该 方面 研发 最 成 功 的 人 工 
智能 机 器 人 “ 丹 髓 ”,， 已 经 被 广泛 应 用 在 播音 主持 的 知 
识 问答 中 ， 其 具有 人 类 大 脑 的 记忆 、 存 储 功能 。 除 此 之 
外 , 还 可 以 利用 人 工 智能 技术 完成 播音 主持 的 配音 工作 ， 
其 配音 原理 基本 与 人 工 智 能 语音 播报 相 类 似 ， 应 用 的 是 
人 工 智 能 语音 合成 技术 ， 可 以 快速 地 找到 数据 与 数据 之 
间 的 内 在 联系 ， 经 过 分 析 输 出 语音 。 

综 上 所 述 ， 人 工 智能 技术 的 应 用 给 播音 主持 工作 带 
来 了 便利 ， 其 主要 是 利用 互联 网 网 络 空间 收集 数据 ， 对 数 
据 进行 一 系列 处 理 和 分 析 ， 在 未 来 人 工 智能 技术 将 会 应 用 
到 播音 主持 工作 的 各 个 层面 中 , 比如 , 自动 王 别 虚假 新 闻 、 
自动 检阅 播音 稿件 ， 算 选 掉 播 音 稿 件 中 的 虚假 内 容 、 低 份 
内 容 、 不 正确 、 不 合理 的 内 容 ， 提 高 播音 稿件 的 质量 ， 减 
轻 该 方面 的 工作 内 容 ， 大 幅度 提高 播音 主持 工作 效率 。 这 
符合 融 媒 体 时 代 发 展 要 求 ， 使 人 工 智能 技术 与 播音 主持 工 
作 完 美 融合 ， 既 促进 人 工 智能 技术 的 发 展 ， 还 能 促进 播音 
主持 工作 方式 的 创新 与 发 展 。 人 工 智 能 技术 的 应 用 将 会 为 
播音 主持 整个 行业 注入 新 的 活力 ， 使 播音 主持 工作 迈 出 从 
“ 融 ” 走 向 “ 智 ”的 步伐 ， 以 此 完成 融 媒 体 时 代 人 工 智能 
技术 在 播音 主持 工作 的 应 用 研究 。 
结语 

本 文 结合 融 媒 体 时 代 特 征 ， 对 人 工 智 能 技术 在 播音 
主持 工作 的 应 用 进行 了 研究 ， 重 点 研究 了 人 工 智 能 技术 
在 播音 主持 工作 的 应 用 优势 、 应 用 过 程 ， 以 及 具体 应 用 
方面 , 有 利于 促进 传统 播音 主持 工作 方式 的 创新 和 变革 ， 
对 推广 人 工 智能 技术 在 播音 主持 工作 中 的 应 用 具有 一 定 
的 促进 作用 ， 极 大 地 增强 了 播音 主持 工作 的 创新 性 。 目 
前 人 工 智 能 技术 在 播音 主持 工作 方面 的 应 用 还 存在 一 定 
的 缺陷 ， 对 于 该 课题 仍 需 继续 深入 研究 ， 并 且 本 文 仅 对 
应 用 优势 、 过 程 等 方面 进行 了 研究 ,研究 内 容 存在 不 足 ， 
今后 会 在 融 媒 体 时 代 人 工 智能 技术 在 播音 主持 工作 的 应 
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用 前 景 方面 进行 深入 探究 。 辆 
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